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摘要 : [目的 /意义 ] 词 表 语 义 组 织 是 馆藏 语义 化 研究 的 重要 组 成 部 分 ,梳理 该 领域 的 历史 演进 有 利于 明晰 
重点 并 推动 其 更 好 发 展 。[ 方 法 /过 程 ] 在 辩 析 词 表 语 义 组 织 领 域 核心 术语 的 基础 上 ,提出 “标准 规范 一 一 语义 


组 织 方法 一 一 支撑 技术 一 一 词 表 应 用 ”研究 框架 ,基于 该 框 


架 梳理 中 文 手 词 表 语 义 研究 代表 文献 。[ 结果 / 结 


论 ] 提 出 词 表 语义 组 织 的 定义 及 其 主体 框架 ,揭示 了 词 表 、 本 体 、 关 联 数 据 等 的 核心 概念 及 其 有 机 联系 ;以 生词 
表 为 例 梳理 我 国 词 表 语 义 组 织 研究 近 10 年 来 的 代表 性 研究 工作 ; 比较 词 表 传统 研究 与 语义 组 织 研究 的 内 在 异 


同 ,并 对 我 国 词 表 语 义 组 织 研究 进行 述评 和 展望 。 
关键 词 : 词 表 关联 数据 语义 网 
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人 关联 数据 云 (LOD ) 显示 ,包含 文献 .生物 .地 理 等 
竹村 域 的 RDF 数据 集 正在 激增 ,万 维 网 已 阔步 向 包含 
无 训 概 念 实体 和 实体 间 丰 富 语义 关系 的 数据 万 维 网 演 
进 N 谷 歌 知 识 图 谱 ( Google Knowledge Graph) .百度 “ 知 
心 过 笑语 义 搜索 项 目的 推进 使 得 语义 网 研究 和 实践 正 
出 萎 统 学 术 领 域 的 独奏 曲 向 学 术 界 与 产业 界 共振 的 协 
作 师 方向 发 展 "-"。 伴 随 着 语义 网 的 发 展 ,知识 组 织 
正 窑 历经 传统 工具 辅助 定位 向 数据 智能 研究 的 演变 。 


践 *"  "” 。 与 本 主题 密切 相关 的 最 新 成 果 是 M. L. Zeng 
等 的 Knowledge organization system in the semantic web: a 
multi - dimensional review 一 文 ,该 文 从 关联 开放 数据 集 
生产 者 、 词 表 生 产 者 和 词 表 使 用 者 等 多 维度 探讨 了 关 
联 开放 数据 集中 词 表 的 作用 。 以 上 研究 要 么 是 于 
绕 一 个 较 小 的 领域 开展 综述 ,对 词 表 语义 组 织 的 主题 
缺乏 紧密 关联 ;要 么 并 不 是 围绕 词 表 语义 组 织 演 进 的 
逻辑 框架 来 展开 的 ; 而且, 由 于 词 表 语 义 组 织 横 跨 语义 
网 和 词 表 两 个 主题 ,以 传统 单一 主题 来 梳理 容易 割裂 


龙 续 是 关联 数据 运动 开展 以 来 ,图 书馆 各 类 资源 的 语 
义 伦 研究 得 到 业内 广泛 关注 , 词 表 作为 馆藏 资源 标 引 
和 辅助 检索 的 基本 工具 ,其 语义 组 织 研究 是 馆藏 语义 
化 研究 的 重要 组 成 部 分 。 

词 表 语 义 组 织 尚 无 统一 的 定义 ,本 文 将 其 界定 为 
运用 语义 网 相关 标准 与 Web 工程 技术 ,推进 词 表 在 网 
络 环境 下 的 描述 .关联 和 应 用 。 作 为 一 个 交叉 领域 ,前 
期 相关 研究 有 一 些 综述 ,例如 : 宋 文 等 梳理 了 词 表 映 
射 互 操作 以 及 转换 为 本 体 的 有 关 研究 ?5 , 薛 春香 等 
围绕 词 表 互 操作 中 的 术语 映射 总 结 了 基于 词 形 .结构 
和 语 料 的 术语 映射 方法 '9% 。 此 外 ,还 有 一 些 学 者 从 遗 
留 资源 关联 数据 发 布 "、 术 语 服务 和 不 同 数据 集 的 
RDF 关联 等 角度 总 结 了 代表 性 的 项 目 . 工 具 和 实 


交叉 主题 间 的 内 在 联系 ,导致 相关 工作 在 整体 发 展 格 
局 中 的 地 位 和 作用 无 法 知悉。 为 此 ,本 文 试图 从 更 开 
放 的 层面 辨析 关键 概念 的 演进 及 其 内 在 异同 ,同时 依 
托 词 表 语义 组 织 框架 着 重 选取 我 国 在 词 表 语义 组 织 领 
域 的 代表 性 研究 工作 进行 综述 。 

本 文 的 贡献 主要 表现 在 :中 提出 了 词 表 语义 组 织 
的 定义 及 其 主体 框架 ,揭示 了 词 表 、 本 体 、 关 联 数 据 等 
的 核心 概念 及 其 有 机 联系 ;@ 以 叙 词 表 为 例 梳 理 了 我 
辐 词 表 语 义 组 织 研究 近 10 年 来 的 代表 性 研究 工作 ;G) 
比较 了 词 表 传统 研究 与 语义 组 织 研究 的 内 在 异同 ,并 
对 我 国 词 表 语 义 组 织 研究 进行 述评 和 展望 。 


2 概念 辨析 


词 表 语 义 组 织 研 究 近 20 年 来 在 快速 发 展 中 ,这 不 
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仅 体现 在 词 表 相 关 概 念 和 范畴 体系 的 拓展 ,同时 ,支持 
词 表 语 义 化 的 技术 标准 和 方法 如 语义 网 .Web 工程 和 
人 工 智能 技术 等 也 处 于 迭代 更 新 之 中 ,概念 拓展 和 支 
撑 技术 的 演进 不 仅 增强 了 该 领域 的 专业 性 ,同时 也 容 
易 造 成 术语 或 概念 关系 的 混淆 ,进而 使 得 领域 研究 趋 
缓 。 因 此 ,厘清 相关 概念 及 其 内 在 逻辑 对 于 推动 领域 
发 展 十 分 重要 。 
2.1 词 表 

词 表 有 狭义 与 广义 之 分 。 狭 义 的 词 表 指 受 控 词 
表 , 又 称 叙 词 表 , 在 我 国 通常 指 主题 词 表 " 。 随 着 网 
络 环境 的 发 展 , 词 表 概念 的 内 涵 和 外 延 在 不 断 扩大 。 
广义 的 词 表 包 含 了 规范 档 、 分 类 法 、 叙 词 表 、 语 义 网 络 
和 本 体 等 类 型 ( 见 图 1) 。 美 国 数字 图 书馆 专家 GC. 
Hedge 于 2000 年 将 其 称 为 知识 组 织 系统 (knowledge 
sization system, 简 称 KOS) 。 知 识 组 织 系统 概念 的 
痊 标 志 着 传统 分 散 的 文献 组 织 工具 在 网 络 环境 下 进 


9 约 化 发 展 的 轨道 。 
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[加 好 术语 表 /词典 (Glossaries/Dictionaries) 
汇 er 本 -一 ”地 名 表 (Gazetteers) 
可 选 词 单 (Pick Iists) 


二 图 1 词 表 内 涵 由 叙 词 表 向 两 端 不 断 扩大 '" 
OO 〇 如 前 所 述 , 词 表 的 概念 是 在 受 控 词 表 术语 基础 上 


表 1 词 表 与 语义 表示 标准 规范 


名 称 标准 规范 中 文 名 称 发 布 年 度 。 标准 组 织 
Z39.19 -2005 ” 单 语种 受 控 词 表 编 制 . 格 式 与 2010 ANSI/NISO 
管理 规则 
BS8723 于 信息 检索 的 结构 化 词 表 ”2005 -2008 BSI 
(I-5) 
JS025964 -1 于 信息 检索 的 叙 词 表 : 单 语 2011 ISO 
种 和 多 语种 
JS025964 -2 于 信息 检索 的 叙 词 表 : 与 其 2013 ISO 
他 词 表 的 互 操作 
XML 可 扩展 标记 语言 1998 W3C 
RDF 资源 描述 框架 1999 W3C 
OWL1 ,2 Web 本 体 语言 2004 W3C 
2008 
SKOS 简单 知识 组 织 系统 2009 W3C 


自 计 算 机 被 应 用 于 文献 情报 工作 以 来 , 词 表 描述 
格式 由 电子 化 逐步 过 渡 到 语义 化 。 电 子 化 的 表示 格式 
有 数据 库 环境 下 的 MARC 和 Web 网 页 下 的 HTML 格 
式 , 例 如 ,AGROVOC 叙 词 表 2000 年 开始 由 印 本 转 为 电 
子 版 存储 于 关系 数据 库 中 ,我 国 于 2005 年 实现 了 《中 
分 类 主题 词 表 》 的 MARC 表示 。 事 实 上 ,HTML 格式 
只 是 将 传统 的 文本 电子 化 ,不 能 适应 计算 机 的 语义 表 
示 和 处 理 ; 而 MARC 格式 虽 能 够 通过 元 数据 揭示 语义 
言 息 ,但 其 标准 无 法 适应 网 络 环境 下 数据 开放 共享 和 
Web 处 理 的 需要 。1998 年 ,XML 成 为 Web 环境 下 数 
据 表示 的 标准 格式 , 它 实现 了 将 数据 的 语义 信息 (元 数 
据 ) 与 数据 内 容 相 分 离 , 同 时 能 够 满足 网 络 环境 交互 和 
共享 的 需要 ,为 此 ,美国 国会 图 书馆 等 机 构 推动 MARC 
格式 向 MARCXML 和 MARC21 转变 ,各 类 元 数据 标准 
和 词 表 也 逐步 采用 XML 语言 作为 数据 表示 的 首选 语 


加 


发 展 起 来 的 。 受 控 词 表 包 含 了 一 系列 术语 并 展示 了 不 
同 的 关系 类 型 ,其 本 质 特征 在 于 术语 /概念 及 其 词 间 关 
系 的 表达 。2005 年 ,美国 信息 标准 委员 会 发 布 的 AN- 
SIANISOZ39. 19 -2005 标准 对 受 控 词 表 的 范围 进行 了 
拓展 定义 ,根据 受 控 的 级 别 由 弱 到 强 将 受 控 词 表 分 为 
可 选 词 单 .同义词 环 ,学术 分 类 表 和 和 叙 词 表 等 类 型 。 

2011 年 ,W3C 图 书馆 关联 数据 孵化 小 组 将 图 书馆 
领域 的 关联 数据 集 分 为 RDF 元 素 集 和 值 词 表 两 种 类 
型 ,它们 也 称 为 结构 化 词汇 表 和 概念 词 表 "" ,前 者 
通常 有 MARC 元 数据 .DC、RDA 和 Bibframe ,后 者 即 是 
广义 的 词 表 , 其 核心 是 包含 上 位 类 关系 .下 位 类 关系 和 
相关 关系 的 叙 词 表 。 词 表 的 外 延 相 较 过 去 得 到 了 明显 
扩大 ,由 原来 的 规范 术语 及 术语 关系 拓展 到 表达 某 一 
领域 的 概念 及 其 概念 关系 。 主 要 词 表 及 其 语义 表示 标 
准 规范 如 表 1 所 示 : 


言 。 为 了 适应 网 上 资源 的 计算 机 智能 处 理 , 电 子 化 的 
词 表 继续 向 实现 语义 表示 的 智能 方面 演化 。 
2.2 语义 

词 表 语义 化 围绕 语义 网 标准 展开 ,本 文 将 语义 界 
定 为 包含 概念 关系 逻辑 和 基于 上 述 逻 辑 的 形式 化 表示 
及 其 智能 机 制 。 语 义 网 的 核心 是 通过 本 体 实现 语义 。 
本 体 包含 两 层 含义 :一 是 本 体 模 型 。 即 本 体 是 将 某 一 
领域 知识 抽象 后 形成 的 概念 及 概念 间 关 系 的 模型 , 通 
常 描述 了 体系 化 的 概念 及 其 概念 关系 "”, 本体 模型 概 
念 的 特性 称 为 数据 属性 ,概念 间 关 系 的 特性 称 为 对 象 
属性 。 本 体 模 型 的 原子 概念 陈述 是 以 “主体 -关系 - 
客体 "组 成 的 RDF 三 元 组 ;二 是 本 体形 式 化 。 本 体 由 
本 体 模型 走向 计算 机 处 理 , 需 要 一 系列 Web 语言 规范 
的 支持 。XML、RDF、OWL 是 万 维 网 联盟 推出 的 Web 
数据 的 语义 表示 规范 ( 见 表 1) 。 基 于 上 述 语言 可 以 对 
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本 体 模型 的 概念 和 属性 构建 多 种 不 同 的 语义 化 描述 。 
词 表 作 为 图 书馆 结构 化 资源 中 的 一 种 类 型 ,其 语义 表 
示 方 法 与 其 他 资源 本 质 上 相同 ,局 部 上 略 有 差异 。 
SKOS 是 专门 针对 词 表 相对 简化 的 结构 提出 来 的 表示 
规范 ,以 区 别 于 本 体 。 我 国 于 2010 年 实现 了 《中 国 分 
类 主题 词 表 》 的 SKOS 表示 中 。 

关联 数据 是 由 万 维 网 之 父 蒂 姆 . 伯 纳 斯 李 于 
2006 年 提出 来 的 一 项 技术 标准 "” ,其 目标 可 概括 为 实 
现 各 类 概念 /实体 及 其 关系 的 计算 机 建 模 . 表 示 和 关联 
发 现 。 关 联 数据 需要 遵循 两 个 基础 标准 :一 是 关联 数 
据 中 的 各 类 概念 需要 用 HTTP URI 表示 ,其 目的 是 让 
每 一 个 概念 能 够 被 HTTP 协议 访问 ,实现 数据 在 Web 
环境 下 的 开放 共享 ;二 是 尽 可 能 提供 丰富 的 URI 以 发 
现 或 关联 更 多 概念 /实体 。 伴 随 越 来 越 多 单个 关联 数 
据 集 的 开放 发 布 ,关联 数据 更 重要 的 意义 在 于 构建 不 
司 治 联 数 据 集 相同 或 相关 概念 /实体 的 关联 , owl; 
地 As ,rdfs :seeAlso 等 关系 词汇 支撑 概念 实体 的 关联 


o 


2GD RDF、 本 体 和 关联 数据 的 关系 


ORDF 是 语义 网 数据 表示 的 建 模 标准 ,本 体 和 关联 
姑 血 记录 均 需 遵循 RDF 模型 实现 结构 化 。 将 某 一 数 
据 器 源 生成 关联 数据 需 针对 该 资源 体系 建立 本 体 模型 
并 对 本 体 模型 形式 化 ,关联 数据 本 质 是 本 体 模型 的 实 
例 之 本 体 和 关联 数据 的 不 同 主要 表现 在 语义 建设 机 制 
的 活 变 ,具体 可 分 为 两 个 维度 :语义 发 展 理念 不 同 。 
语 交 网 发 展 之 初 重 在 自主 构建 本 体 并 通过 更 强大 的 推 
晶 受 名 来 实现 更 丰富 的 语义 ;但 关联 数据 提出 后 则 侧 
重 国 重用 包括 词 表 在 内 的 结构 化 资源 来 构建 轻 量 级 
本 体 ,同时 依托 不 同 资源 的 实体 关联 来 实现 语义 
的 丰富 化 ,淡化 了 原始 本 体 构建 及 其 复杂 推理 逻辑 ; 
@@ 本 体 模型 形式 化 理念 不 同 。 与 传统 本 体 模型 重 在 
自主 定义 单一 的 本 体 词汇 集 实现 形式 化 不 同 ,关联 
数据 强调 优先 利用 多 个 成 熟 的 本 体 词汇 集 实现 本 体 
模型 的 形式 化 ,通过 最 大 化 重用 成 熟 本 体 词汇 集 有 
助 于 为 后 续 与 其 他 RDF 数据 集 形成 关联 关系 英 定 基 
础 。 由 于 本 体 词汇 集 选取 的 差异 ,围绕 某 一 数据 资 
源 建立 的 本 体 模型 可 能 有 多 种 不 同 的 本 体形 式 化 方 


案 。 


3 ”研究 内 容 


结合 词 表 语义 组 织 定 义 ,本 文 将 词 表 语 义 组 织 框 
架 从 标准 规范 到 词 表 应 用 划分 为 4 个 层次 ( 见 图 2)。 
其 基本 逻辑 是 : 词 表 语义 组 织 是 框架 的 核心 ,实现 上 述 
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过 程 需 以 词 表 和 W3C 提供 的 相关 标准 作为 基础 ,推进 
词 表 语 义 组 织 与 应 用 的 技术 实现 则 需要 Web 工程 技 
术 的 支持 。 图 2 中 , 词 表 语义 描述 、 词 表 转 化 为 本 体 、 
词 表 关联 数据 发 布 存 在 一 定 的 包含 关系 ,反映 了 词 表 
语义 组 织 在 近 20 年 演进 中 方法 理念 随 着 标准 的 动态 
变化 而 不 断 深化 。 


术语 服务 词 表 应 


关联 发 布 技术 | 。 | 可 视 化 技术 关联 匹配 技术 撑 技 术 
Ee 
问 表 关联 数据 
问 表 转化 为 本 体 加 
词 表 语 义 描述 
词 表 标准 语义 技术 标准 标准 规 郊 


2 词 表 语 义 组 织 框架 


图 2 中 的 支撑 技术 包括 但 不 限于 以 上 模块 ,其 原 
因 在 于 :中 技 术 始终 是 为 内 容 服 务 的 , 词 表 语 义 组 织 的 
内 容 伴随 着 技术 的 发 展 在 不 断 丰 富 ;外 由 于 不 同学 者 
技术 划分 的 差异 及 其 内 容 侧重 点 不 尽 相同 ,支撑 技术 
的 表现 形式 可 能 多 样 。 下 文 以 图 2 框架 对 中 文 叙 词 表 
语义 组 织 工 作 展开 综述 ,重点 在 于 反映 主干 工作 的 同 
时 ,揭示 不 同 领域 的 有 机 联系 。 
3.1 词 表 语义 组 织 

词 表 语义 组 织 是 在 词 表 数据 库 化 和 Web 网 页 化 
的 基础 上 ,面向 语义 网 相关 标准 逐步 发 展 起 来 的 ”。 
结合 图 2, 笔 者 将 词 表 语义 组 织 研究 按照 时 代 演 进 划 
分 为 “语义 描述 一 一 本 体 转化 一 一 发 布 为 关联 数据 ”3 
个 层次 ( 见 表 2) 。 分 类 法 规范 档 和 撤 词 表 等 的 语义 
组 织 均 包含 以 上 过 程 ,比较 而 言 , 叙 词 表 在 整个 词 表 结 
构 中 处 于 关系 层 , 相 较 其 他 更 具 代 表 性 。 下 面 重 点 以 
叙 词 表 为 例 综述 词 表 语 义 组 织 的 代表 工作 ,有 关 我 国 
分 类 法 和 规范 档 的 研究 工作 见 文献 。 

笔者 首先 揭示 词 表 语 义 组 织 的 演进 逻辑 ,然后 梳 
理 我 国 词 表 语义 组 织 的 相关 工作 。 
首先 ,从 初期 发 展 来 看 ,由 于 语义 相关 标准 尚 不 够 
成 熟 , 图 书馆 学 情报 学 界 (简称 "图 情 界 ” ) 重 在 结合 令 
词 表 理解 语义 相关 标准 和 概念 。 作 为 在 印 本 时 代 
形成 ,以 术语 为 中 心 ,包含 “用 、 代 、 属 、 分 、 参 ”等 少数 
粗 粒 度 词 间 关 系 的 词 表 , 与 在 网 络 环境 下 形成 的 以 概 
念 为 中 心 .强调 细 粒 度 语义 关系 的 本 体 有 一 定 的 近似 
关系 。 正 因此 ,利用 词 表 构 建 领域 本 体 或 者 使 词 表 实 


| 
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ChinaXiv 合 作 期 刊 
陶 俊 . 词 表 语 义 组 织 研 究 的 演进 (1998 -2018)[J]. 图 书 情报 工作 ,2018 ,62(21 ) :140 - 148. 
表 2 词 表 语义 组 织 演进 
序号 组 织 层次 内 容 特 征 备注 
1 语义 描述 结合 XML、RDF .OWL .SKOS 等 表示 规范 探索 描述 方法 局 部 探索 
(2000 年 至 今 ) 
2 本 体 转化 初期 主要 是 利用 叙 词 表 构建 本 体 ,后 来 逐步 专门 针对 叙 词 表 实 现 本 体形 式 化 。 一 种 思路 是 不 改变 词 表 局 部 探索 
(2003 年 至 今 ) 结构 实现 形式 化 ;一 种 思路 是 将 粗 粒度 的 词 表层 次 结构 改变 为 细 化 的 网 络 结构 ,以 概念 为 中 心 定义 概 
念 和 属性 并 细 化 概念 关系 ,在 此 基础 上 实现 形式 化 描述 ,生成 新 的 本 体 [24] 
3 发 布 为 关联 数据 以 词 表 发 布 为 中 心 , 尽 可 能 保留 词 表 结 构 , 基 于 关联 数据 标准 制定 HTTP URI 定义 本 体 模型 和 形式 化 整体 探索 
(2008 年 至 今 ) 方法 作为 描述 词 表 关系 的 基础 ,构建 批量 转换 程序 ,将 新 生成 的 资源 运用 关联 数据 工具 发 布 


现 语义 描述 就 成 为 图 情 界 研究 的 中 心 议题 。 

第 二 ,从 研究 对 象 来 看 , 词 表 语义 描述 阶段 因 相 关 
语义 标准 和 技术 不 成 熟 ,其 研究 以 局 部 术语 单元 的 理 
论 探 索 为 主 ;而 在 关联 数据 阶段 ,由 于 SKOS 标准 和 关 
联 数据 发 布 技术 相对 成 熟 ,其 研究 以 词 表 整体 探索 为 
主 , 需 以 数据 库 版 或 Web 版 为 基础 。《 农 业 科学 叙 词 
汉中 国 分 类 主题 词 表 》 因 在 电子 化 建设 方面 相 较 其 


二 
结合 


届时 也 会 结合 不 同情 境 需 求 重新 定义 概念 模型 ; 记 


玫 


标准 类 型 试验 词 表 转换 内 容 
OWL 中 分 表 所 有 内 容 
PROS 中 分 表 核心 关系 
SKOS 中 档 表 所 有 内 容 
SKOS 农 表 核心 关系 
SKOS 中 分 表 所 有 内 容 
SKOS 中 分 表 所 有 内 容 
(证:《 中 分 表 》《 中 档 表 》《 农 表 ) 依 次 指 (中 国 分 类 主题 词 表 》《 中 


首先 ,从 词 表 的 语义 表示 语言 和 历史 发 展 阶段 来 
看 ,在 未 出 现 专 门 针 对 词 表 转 换 的 标准 规范 SKOS 以 
前 , 曾 新 红 基 于 OWL 语言 对 我 国 大 型 通用 主题 词 表 进 
行 了 语义 描述 探索 ”。 词 表 类 型 集中 在 《中 分 表 》《 中 
档 表 》 和 《 农 表 》 等 大 型 主题 词 表 ,《 中 分 表 》 和 《 农 表 》 
实现 了 电子 化 ,为 语义 化 探索 提供 了 坚实 的 基础 。 
2009 年 ,SKOS 成 为 词 表 建 设 推 荐 标准 后 ,后 续 人 研究 主 
要 以 SKOS 进行 。 

从 转换 内 容 来 看 , 曾 新 红 、 刘 丽 研 和 段 菜 婷 等 在 词 
表 转 换 研究 上 具有 开拓 性 , 曾 新 红 和 有 段 荣 婷 主要 结合 
OWL 语言 和 SKOS 语言 对 《中 分 表 》 和 《中 档 表 了》 提供 
了 总 体 转换 方案 ,包括 对 主 表 、 附 表 、 索 引 各 部 分 实现 
SKOS 描述 “”。 刘 丽 斌 等 重 在 以 词 表 中 的 “用 、 代 、 
属 、 分. 参 "等 核心 关系 为 例 进行 了 自动 转换 探索 。 
鲜 国 建 等 结合 前 述 方法 重点 围绕 《 农 表 》 进 行 了 研究 ， 


国 


表 3 ”中文 叙 词 表 语义 转换 比较 一 


方 
方 
方 


表 发 布 为 关联 数据 包含 了 以 前 语义 描述 .定义 本 体 模 
型 和 本 体形 式 化 等 过 程 ,其 不 同 在 于 融入 了 关联 数据 
标准 ,同时 侧重 于 将 词 表 与 其 他 书目 资源 一 样 作为 具 
体 的 实例 资源 ,这 体现 了 词 表 作用 在 语义 技术 的 应 用 
下 正在 逐步 跳出 既 有 的 工具 辅助 功能 的 定位 ,更 多 呈 
现 出 资源 属性 下 数据 智能 的 演化 。 

综合 以 上 分 析 , 词 表 语 义 组 织 是 一 个 不 断 动态 发 
展 的 过 程 。 以 此 为 基础 ,下 文 将 综述 中 文 叙 词 表 语义 
转换 的 重点 研究 。 曾 新 红 、 刘 丽 斌 、 段 荣 婷 、 鲜 国 建 、 刘 
华 梅 、 欧 石 燕 等 均 移 后 对 中 文 叙 词 表 的 语义 转换 开展 
了 方法 探索 ,在 业内 具有 代表 性 ,如 表 3 所 示 : 


览 
实现 层次 转换 语言 关联 数据 年 份 
方案 描述 无 否 2005 
案 描 述 批量 转换 Java 否 2009 
方案 描述 无 否 2010 
案 描述 批量 转换 java 是 2013 
案 描述 批量 转换 VB 否 2014 
案 描述 批量 转换 Java 是 2015 


国 档案 主题 词 表 》 和 《农业 科学 叙 词 表 》 


同时 构建 了 关联 数据 发 布 平台 。 

从 语义 关系 和 技术 实现 视角 来 看 , 刘 丽 斌 、 鲜 国 建 
和 欧 石 燕 等 运用 高 级 编程 语言 Java 实现 了 中 文 叙 词 表 
的 SKOS 自动 转换 。 刘 丽 滤 等 最 早 开展 中 文 叙 词 表 语 
义 转换 并 实现 了 《中 分 表 ) 用 、 代 、 属 .分 、 参 、 族 等 核心 
关系 的 自动 转换 ” 。 鲜 国 建 等 采用 SKOS 和 SKOS - 
XL 实现 了 对 《农业 科学 叙 词 表 》 的 语义 化 表示 并 基于 
Virtuoso 实现 了 关联 数据 发 布 ”*” 。 欧 石 燕 则 在 “月 
代 \ 属 ,分 参 、 族 ”等 传统 词 间 关 系 SKOS 转换 基础 上 ， 
以 SKOS -EX 实现 了 组 配 、 组 面 、 族 项 等 复杂 概念 的 语 
义 化 表示 ,并 通过 Java 语言 实现 了 《中国 分 类 主题 词 
表 》 词 表 部 分 全 描述 和 批量 转换 ,并 基于 Pubby 平台 实 
现 了 关联 数据 发 布 ” 。 刘 华 梅 提出 基于 中 分 表 MARC 
数据 转换 为 SKOS 的 映射 方案 ,同时 采用 VB 语言 实现 
了 主题 概念 的 批量 转换 。 


了 
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3.2 支撑 技术 研究 

将 词 表 发 布 为 关联 数据 主要 依托 于 Web 工程 技 
术 ,重点 包括 关联 数据 发 布 技术 可视化 技术 和 关联 匹 
配 技术 等 。 
3.2.1 关联 发 布 作为 RDF 数据 集 的 一 种 类 型 ,各 
类 RDF 数据 集 的 关联 发 布 方 法 均 适 用 于 词 表 “|。 
词 表 RDF 数据 集 的 生成 需要 考虑 词 表 建设 基础 和 词 
表 结 构 的 差异 ,其 步骤 可 简要 概括 为 :HTTP URI 的 确 
定 一 一 基于 词 表 结构 的 本 体 建 模 一 一 实体 RDF 
化 一 一 实体 关联 化 一 一 RDF 文件 一 一 关联 数据 发 
布 一 一 开放 SPARQL 查询 等 阶段 。 从 关系 数据 库 文件 
输入 输出 角度 来 看 ,其 输出 包括 文本 文件 一 一 SQL 文 
件 一 一 RDF 文件 (包括 rdf/xml ,owl,skos 文件 等 )。 如 
图 3- 所 示 : 


©O 


图 3 词 表 发 布 为 关联 数据 的 主要 步骤 


以 中 文 叙 词 表 的 转换 工作 为 例 , 鲜 国 建 等 ”以 
《 农 表 》 的 关系 数据 库 为 基础 ,结合 《 农 表 》 的 结构 形成 
存 光 方案 ,包括 设置 HTTP URI, “用. 代 、 属 分. 参 ” 等 
主要 关系 与 SKOS 标签 的 对 应 等 。 刘 丽 斌 与 欧 石 菩 
Em 引 则 以 《中 国 分 类 主题 词 表 》Web 版 为 基础 ,通过 
羽 轰 其 HTML 格式 得 到 大 量词 汇集 合 ,经 过 预 处 理 获 
得 爱 本 文件 ,然后 将 和 竺 转换 的 叙 词 表 文本 文件 写 人 到 
SQ 数据 库 , 在 此 基础 上 确定 本 体 建 模 方案 ,在 Jena 
API 等 工具 包 的 支持 下 编写 Java 转换 程序 实现 批量 转 
换 得 到 RDF 数据 集 。 

3.2.2 可 视 化 ”RDF 数据 集 在 反映 细 粒 度 概念 以 及 
多 元 语义 关系 方面 具有 优势 ,但 其 序列 化 格式 因 着 眼 
于 机 器 处 理 而 难以 供 人 们 有 效 识别 潜在 关系 , 故 可 视 
化 十 分 必要 。 本 体 开源 可 视 化 工具 WebVOWL 、Prote- 
ge .Welkin 等 有 利于 揭示 词 表 概念 之 间 的 语义 关系 。 
例如 , 范 炜 等 在 构建 《中 分 表 》 主 题词 数据 的 术语 服务 
原型 系统 中 采用 Graphviz 和 Protovis 类 库 实 现 了 关联 
数据 的 可 视 化 ”。 洪 娜 等 从 开发 平台 应 用 类 型 \ 开 
源 与 否 .输入 输出 格式 .是 否 支持 三 元 组 仓储 、 交 互 能 
力 等 方面 比较 了 RelFinder, Graphviz,RDF Gravity ,RD- 
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数据 集 为 基础 ,利用 在 线 工 具 构 建 RelFinder 构建 关联 
数据 原型 系统 ,通过 可 视 化 界面 发 现 潜在 关联 关系 。 
赵 龙 文 和 陈涛 等 则 分 别 采用 Gruff 研究 了 政府 领域 关 
联 数据 的 可 视 化 和 家 谱 关 联 数据 实例 中 RDF 数据 的 
可 视 化 |。 
3.2.3 关联 匹配 不 同 RDF 数据 集 之 间 构 建 关联 是 
关联 数据 五 星 标准 的 要 求 。 截 至 2017 年 2 月 的 LOD 
云图 , 仅 有 10% 的 数据 成 为 五 星 关联 数据 ” 。 继 2006 
a 中 国 《农业 科学 氢 词 表 》 和 AGROVOC 之 间 的 映 
射 ” ,联合 国 粮农 组 织 于 2011 年 探索 将 AGROVOC 与 
EUROVOC NALT .GEMET .STW .LCSH 和 RAMEAU 的 
关联 匹配 并 将 其 发 布 为 关联 数据 ”“ 。 相 比 海外 有 关 
实践 ,我 国 词 表 研究 在 此 领域 的 探索 更 少 ,大 型 词 表 间 
的 关联 研究 几乎 空白 。 陶 俊 ” 与 朱 雯 晶 等 ”先后 介 
绍 了 不 同 RDF 数据 集 关 联 发 现 的 自动 化 工具 ,包括 
SILK 等 。 鲜 国 建 等 在 探索 4《 农 表 》 关 联 数据 发 布 中 扼 

要 介绍 《 农 表 》 与 AGROVOC .NALT 、LCSH 和 EURO- 
VOC 的 精确 匹配 关联 结果 ,但 并 未 结合 实例 阐述 运用 
相关 映射 工具 来 实现 关联 匹配 的 实验 过 程 ”。 相 比 
词 表 关联 ,更 多 人 研究 集中 在 书目 数据 集 或 文献 资源 数 
据 集 的 关联 上 '“! 。 例 如 , 虞 为 利 等 用 海外 书目 数据 片 
段 同 时 融入 SILK 工具 来 查找 等 同 关系 探讨 了 书目 数 
据 集 和 DBpedia 之 间 的 关联 “ , 钟 远 薪 和 刘炜 等 结合 
上 海 图 书馆 书目 数据 和 DBpedia 数据 探讨 了 不 同 数据 
集 作者 有 关 信息 的 关联 ” 。 
3.3 词 表 语 义 应 用 研究 

我 国 词 表 语义 应 用 方面 的 研究 型 探索 主要 体现 在 

术语 服务 和 语义 知识 库 两 方面 。 一 方面 ,从 图 书 情报 
角度 来 看 , 词 表 建设 的 目标 是 支撑 网 络 环境 下 的 术语 
服务 ,主要 包含 提供 适用 于 人 访问 的 Web 界面 术语 查 
询 以 及 支持 计算 机 处 理 的 应 用 编程 接口 ; 另 一 方面 ， 
从 语义 网 建设 角度 来 看 , 词 表 发 布 为 关联 数据 ,本 质 上 
是 一 种 精炼 化 的 语义 知识 库 , 其 概念 关系 可 支持 知识 
发 现 。 从 应 用 领域 角度 来 看 ,术语 服务 和 知识 库 可 应 
用 于 医学 .生物 ,法律 等 多 领域 场景 。 
3.3.1 术语 服务 多 位 学 者 探讨 了 基于 REST 架构 
的 术语 服务 技术 实现 。 欧 石 燕 等 以 ( 汉 表 》 为 例 实现 
了 REST 架构 的 术语 服务 原型 系统 ,同时 从 编目 和 元 
数据 创建 ,信息 检索 和 资源 导航 等 情境 阐释 了 术语 服 
务 应 用 形态 “”” 。 曾 新 红 等 基于 分 类 法 系统 CLSS 提 


FViz + + ,Gruff 等 5 种 可 视 化 工具 的 差异 ”” 。 一 些 较 
低 门 槛 的 工具 更 受 大 众 欢 迎 , 洪 娜 . 任 瑞 娟 、 石 泽 顺 
等 -以 生 物 医学 中国 知 网 和 LISTA 数据 库 的 有 关 
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供 了 基于 Web 服务 API 和 Web 页 面 检索 的 术语 服 


务  。 此 外 ,一 些 学 者 以 相关 SKOS 文档 或 OWL 文 
档 为 基础 构建 术语 服务 原型 系统 。 徐 雷 和 董 慧 以 美国 


陶 俊 . 词 表 语义 组 织 研究 的 演进 (1998 -2018)[J]. 图 书 情报 工作 ,2018 ,62(21 ) :140 - 148. 


国家 癌症 研究 所 的 NCI 癌症 叙 词 表 OWL 文档 作为 数 
据 源 ,依托 图 形 数据 库 Neo4j 作为 存储 平台 构建 了 一 
个 REST 架构 的 术语 服务 ” 。 范 炜 等 基于 Cherrypy + 
TDB + Joseki 作为 关联 数据 发 布 框架 ,在 此 基础 上 构建 
了 术语 服务 原型 |。 

3.3.2 知识 库 部 分 学 者 围绕 语义 知识 库 构 建 探索 
了 词 表 在 支持 概念 检索 方面 的 作用 。 北 京 大 学 王 军 以 
《中 分 表 》 的 类 目 和 主题 词 以 及 元 数据 为 基础 ,构建 书 
目 本 体 模型 KVision 并 形式 化 ,同时 以 北京 大 学 图 书馆 
计算 机 领域 的 书目 数据 作为 本 体 实例 构建 语义 知识 库 
进而 实现 概念 。 欧 石 燕 等 以 多 个 文献 数据 源 的 关 
联 数据 转换 为 中 心 ,实现 上 述 不 同 数据 源 中 受 控 词汇 、 
人 名 地 名 等 的 RDF 关联 ;在 此 基础 上 ,进一步 运用 
印 然 语言 处 理 技术 探索 将 自然 语言 转化 为 结构 化 的 
SPARQL 查询 技术 ,实现 对 多 个 RDF 数据 集成 搜索 和 
自动 问答 ” 。 


4 人 iN 词 表 语 义 组 织 问题 的 内 在 联系 
.之 传统 图 书 情报 领域 , 词 表 研 究 的 三 大 典型 问题 是 
词组 标准 规范 . 词 表 构 建 和 词 表 的 术语 映射 ( 见 表 4) 。 


语 必 网 标准 下 则 更 侧重 于 探究 “ 词 表 语 义 描述 一 一 词 
表 转 化 为 本 体 /关联 数据 发 布 一 不同 数 据 集 间 开放 


关联 "等 问题 。 这 些 新 问题 均 是 建立 在 前 述 经 典 问题 
基础 之 上 。 首 先 ,从 术语 维度 看 ,概念 和 概念 关系 的 语 
义 表示 尽管 更 多 依赖 于 各 类 语义 规范 的 应 用 ,但 同时 
离 不 开 对 词 表 标准 的 深入 理解 ;其 次 ,从 输出 维度 
看 , 词 表 转化 为 本 体 以 及 关联 数据 发 布 本 质 上 是 促 
进 计算 机 处 理 , 它 需要 以 丰富 的 词汇 和 词 间 关 系 作 
为 基础 , 词 表 构建 与 更 新 的 目标 正 是 实现 上 述 目 
标 ”! ;再 次 ,从 关系 维度 看 ,不 同 数据 集 间 开放 关联 
的 重点 是 探讨 与 其 他 RDF 数据 集 间 的 概念 等 同 关 
系 ,这 与 词 表 映射 探讨 术语 或 概念 的 映射 具有 一 致 
性 。 尽 管 在 技术 实现 上 可 能 有 Silk 等 针对 关联 开放 
数据 集 的 关联 发 现 方法 ,但 从 底层 的 映射 或 对 齐 方 
法 来 讲 ,大 多 仍 以 各 类 字符 串 相似 度 算法 及 其 API 来 
实现 ” ,这 与 本 体 匹 配 的 相关 方法 具有 一 致 性 。 总 
之 , 词 表 语 义 组 织 和 词 表 本 身 建设 是 互 为 联系 的 整 
体 。 


表 4 词 表 语 义 组 织 研 究 相 关 问题 比较 


比较 维度 词 表 本 身 语义 网 标准 
基础 维 标准 规范 研究 词 表 概 念 和 属性 的 语义 表示 


目标 维 词 表 构 建 与 更 新 
关系 维 ”” 词 表 映 射 / 互 操作 


词 表 转化 为 本 体 / 关 联 数据 发 布 
不 同 数 据 集 间 关联 匹配 


4.2 研究 实践 性 强 , 专 业 化 研究 队伍 较 少 

总 体 来 看 ,我国 词 表 研 究 呈 现 出 两 大 特点 : 

(1) 研 究 实 践 性 强 。 词 表 研 究 以 国家 科技 文献 中 
心 支撑 机 构 为 主 ,侧重 于 工程 实践 ,比如 ,中 国 科 学 院 
文献 情报 中 心 围绕 面向 外 文 知 识 组 织 平台 与 集成 系统 
建设 开展 了 大 量 工 作 “” ;中 国 科学 技术 信息 研究 所 
以 4 汉语 主题 词 表 》 的 更 新 为 基础 ,深入 推进 国家 叙 词 
库 建 设 ,形成 了 较 强 的 实践 特色 '” ;中 国医 学 科学 院 
长 期 围绕 医学 领域 开展 词 表 的 语义 应 用 研究 跟踪 和 实 
践 探 索 ; 中 国 农业 科学 院 在 农业 科学 词 表 关 联 发 布 与 
平台 方面 形成 了 一 定 特色 ;在 业内 形成 了 一 定 影 
响 ;此 外 ,国家 图 书馆 与 全 国 图 书 情报 领域 多 家 单位 围 
绕 《 中 国 分 类 主题 词 表 》 的 开放 性 研究 形成 了 影响 。 
相 比 上 述 方面 ,更 多 机 构 主 要 以 自由 探索 为 主 ,缺乏 集 
聚 性 。 总 体 来 讲 , 综 合 型 的 实践 跟踪 和 概要 研究 居多 ， 
围绕 具体 科学 问题 的 工程 研究 和 实践 创新 相对 缺乏 ， 
体现 出 普及 性 和 碎片 化 的 特点 。 

(2) 专业 化 研究 队伍 较 少 。 相 比 其 他 研究 ,图 书 
馆 实践 部 门 和 高 校 图 情 学 者 对 词 表 的 连续 研究 规模 相 
对 不 足 。 笔 者 以 为 ,这 一 现象 具有 内 外 两 方面 的 因素 。 
内 因 方 面 , 词 表 语义 组 织 研究 的 专业 门槛 在 逐步 提升 。 
伴随 词 表 标准 适应 网 络 环境 , 词 表 研究 在 变革 中 形成 

量 新 的 概念 术语 ,与 此 同时 ,语义 网 .Web 工程 和 自 
然 语 言 处 理 等 新 技术 正 日 益 主 导 词 表 建 设 的 发 展 ,学 
科 交 融 使 得 词 表 研究 不 再 属于 传统 图 书 情报 领域 知识 
范畴 ,而 更 多 依赖 于 计算 机 应 用 的 支撑 ;外 因 方 面 , 作 
为 图 书 情报 领域 的 核心 领域 , 词 表 的 传统 固有 定位 在 
网 络 环境 下 逐步 边缘 化 。 以 上 两 方面 使 得 持续 开展 词 
表 探 索 的 人 员 正 在 日 益 减 少 , 词 表 领域 正在 随 着 人 工 
智能 技术 的 应 用 和 语义 搜索 服务 的 形成 发 生 潜在 变 
化 ,这 给 词 表 语义 组 织 研究 带 来 了 挑战 的 同时 也 意味 
着 机 遇 。 


词 表 语义 组 织 是 适应 网 络 时 代 需 要 逐步 发 展 起 来 
的 。 伴 随 词 表 形 成 RDF 数据 集 并 以 关联 数据 发 布 ,其 
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应 用 不 再 拘泥 于 文献 检索 和 辅助 语义 标 引 等 术语 

务 , 搜 索引 擎 在 向 逢 nn 
网 络 化 生存 的 基础 工具 ,基于 此 ,未 来 在 优化 术语 服务 
实践 的 同时 ,围绕 语义 搜索 探究 词 表 应 用 是 深化 研究 
的 重点 。 具 体 而 言 ,可 从 三 方面 展望: 

(1) 加 强大 型 词 表 语义 关联 匹配 探索 。 伴 随 语义 
环境 的 形成 ,语义 搜索 的 发 展 方向 之 一 是 向 信息 关联 
方向 发 展 ,对 《汉语 主题 词 表 》 和 《中 分 表 》 等 大 型 词 表 
与 国内 外 其 他 词 表 开 展 对 照 映射 ”" ,推进 《中 分 表 》 
的 分 面 化 改造 等 ,有 利于 支持 基于 信息 发 现 的 深度 检 
索 ,进而 提升 大 型 词 表 在 新 时 代 的 应 用 价值 。 在 此 基 
础 上 ,进一步 基于 关联 匹配 ,探索 不 同类 型 词 表 关联 方 
法 与 实践 ,尤其 是 词 表 与 各 类 RDF 数据 集 ( 词 表 数 据 
集 > 其 他 资源 数据 集 ) 间 的 开放 关联 实验 和 技术 创新 研 
六 下 来 的 重点 
1 如 (2) 拓 宽 词 表 语义 组 织 的 技术 范畴 。 当 前 图 情 
由 的 问 表 语 看 义 组 织 技术 多 集中 在 W3C 倡导 的 关联 数 
据 抄 术 。 从 发 展 趋势 看 ,关联 数据 相关 标准 和 技术 只 
是 中 的 一 个 分 支 ,与 此 对 应 的 是 ,人 工 神经 网 络 模 
玲 趟 知 计算 等 得 到 快速 发 展 并 在 多 领域 应 用 使 得 上 
述 3 法 成 为 发 展 数据 智能 的 利器 。 显 然 , 利 用 本 体 , 元 
疾 测 等 通过 人 为 建立 知识 表达 模型 的 语义 网 方法 正 受 
到 且 自 以 词句 向 量 为 基础 实现 全 程 无 人 工 干巴 的 拓 
般 生 算 方 法 的 挑 成。 正如 艾 思维 尔 首席 架构 师 B. P. 
Allen 所 指出 的 ,i 看 义 网 是 基于 人 而 不 是 基于 机 器 , 它 
| 
机 绒 阅 读 来 建立 知识 图 谱 ' 中 。 因 此 ,以 相关 平台 系统 
或 APL 应 用 为 基础 ,吸收 数据 库 、 自 然 语言 处 理 .机 如 
学 习 (深度 学 习 ) 等 多 学 科 领 域 探索 知识 图 谱 的 有 关 
方法 实践 是 未 来 深化 词 表 语义 组 织 人 
段 后 -6 。 

(3 ) 深化 词 表 语 义 组 织 的 应 用 领域 。 首 先 , 进 一 
步 推 进 各 类 资源 的 关联 数据 发 布 是 深化 语义 搜索 的 基 
础 。 通 过 构建 词 表 与 领域 数据 集 的 RDF 链接 使 词 表 
概念 成 为 各 类 领域 数据 集 的 聚合 中 介 。 换 言 之 ,领域 
数据 集 关 联 发 布 越 多 ,未 来 词 表 数 据 集 潜在 聚合 面 越 
广 。 英国 .芬兰 等 以 数字 人 文 运动 为 纽带 ,进一步 推进 
历史 法律 等 资源 的 关联 发 布 是 上 述 工作 的 体现 。 其 
次 ,结合 元 数据 词 表 探索 融和 商业、 社交 网 络 和 智慧 交 
通 等 更 广泛 的 人 物 、 地 理 和 应 用 场景 "- ,借助 词 表 
语义 标 引 研究 大 数据 环境 下 的 用 户 画像 和 个 性 化 推荐 
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与 挖掘 是 拓展 词 表 应 用 的 重要 方面 。 
6 结语 


自 1998 年 NKOS ( network knowledge organization 
system ,简写 NKOS) 小 组 成 立 以 来 , 词 表 由 网 络 化 向 语 
义 化 不 断 演进 , 词 表 词义 组 织 研究 在 概念 ,内 容 、 方 法 
与 技术 等 方面 均 有 了 长 足 发 展 。 相 比 传统 综述 研究 围 
绕 单一 的 词 表 或 语义 网 等 具体 领域 进行 梳理 ,本 文选 
择 将 词 表 与 语义 网 等 标准 相 结 合并 从 纵向 勾勒 词 表 语 
义 组 织 的 整体 发 展 及 其 内 在 机 制 ,以 弥补 历史 同类 研 
究 的 不 足 。 当 然 , 本 文 也 存在 不 足 之 人 处。 首先 ,本 文 的 
内 容 跨 度 较 大 ,致使 在 突出 重点 的 同时 横向 局 部 的 分 
析 上 稍 显 不 足 , 例 如 有 关 词 表 标 准 的 研究 和 词 表 语义 
化 的 领域 应 用 等 介绍 较 少 ;其 次 ,本 文 在 词 表 语义 组 织 
研究 工作 方面 主要 围绕 中 文 词 表 语 义 化 工作 进行 , 海 
外 同类 研究 对 于 深化 词 表 研 究 同 样 重 要 。 以 上 不 足 之 
处 将 在 后 续 人 研究 中 加 以 弥补 。 
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A Survey for Research on Semantic Organization of Vocabularies( 1998 -2018 ) 


Tao Jun 


School of Public Management, Northwest University, Xi’ an 710127 


Abstract : [Purpose/significance | Semantic organization of vocabulary, an important part in collection semantic re- 


sh, is the focus of knowledge organization study. A research review in this field is helpful to promote its development. 


[ NMethod/ process ] Based on the analysis of the core terms in the field of semantic organization of vocabulary, this paper 


pz6peses the analytical framework of “ standard specification -semantic organization method -supporting technology -vocabula- 


LD 


QO. .3 ; . i 
ry plication”. With above framework, the paper reviews literature about method, technology and application. [ Result/ 


conclusion | Firstly, the paper gives the definition and main frame of vocabulary semantic organization, discusses the core 


concepts and their relationship including vocabulary, ontology and linked data. Then taking the example of thesaurus, it 


summarizes the typical research of vocabulary semantic organization in China in recent ten years. And it compares the tra- 


ditional vocabulary research and semantic research. On the basis of summarizing the above literature, the current situation 


and future development of semantic organization of Chinese vocabulary are discussed. 
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